import numpy as np
import  matplotlib.pyplot  as  plt
import  pandas  as  pd
plt.rcParams['font.sans-serif'] = ['SimHei']	# 指定中文黑体字体
# 下面的False修正坐标轴上负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False

df = pd.read_excel('stock.xlsx', dtype={'code': 'str'}) 	# code字符串类型
df.set_index('code', inplace=True)			# 将code设为索引列
df.loc['002522']            					# 显示某只股票基本面数据
len(df.industry.unique())
# 按地区统计上市公司数量，体现地区经济实力
df.groupby('area').size().sort_values(ascending=False)
year = df.timeToMarket.astype('str').str[:4]  # 转为字符串，提取前4位的年份
yearnum = df.groupby(year).size()	 # 按年份统计，得到每年股票发行量
yearnum
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定中文黑体字体
# 下面的False修正坐标轴上负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False
# 数据集中有几支股票没有发行年份（年份为0）, 作图时排除0年份
yearnum[yearnum.index!='0'].plot(fontsize=14, title='年IPO数量')
df.pe.mean()
